[Alteryx Designer:ツールのご紹介]クロスタブツールについて
Alteryx絶賛勉強中のshoです。
はじめに
セルフサービス分析ツールであるAlteryxでは、製品に関する認定試験を受けることができ、初級から中級レベルの試験が、Alteryx Designer Coreとなっています。
Alteryxの認定試験の詳細については、こちらにて紹介しています。
Alteryx Designer Coreを受験するにあたっては、各種ツールの理解を深めておく必要があります。
今回は以下のページから、“クロスタブ”ツールについて学んで行きたいと思います。
クロスタブツール(Cross Tab Tool)
クロスタブツールは、縦持ちのデータを横持ちにピボットするためのツールです。
クロスタブツールは、以下のいずれかの方法でワークフローに追加します。
- ツールの一覧から“変換”カテゴリにあるクロスタブツールを選択し、キャンバスにドラッグ
- キャンバス内にて、右クリックより“挿入”を選択し、“変換”カテゴリにあるクロスタブツールを選択
- 右上の検索画面にて“cross tab”と入力し、クロスタブツールを選択
データは、クラスメソッドのオフィスのある地域の6月の気温の情報を取り込みました。
出典:気象庁ホームページ(https://www.data.jma.go.jp/obd/stats/etrn/index.php)
ここからは、クロスタブツールの動作についてみていきたいと思います。
クロスタブツール設定方法
今回のデータでは、日ごとの最低気温・最高気温のデータが同じ列に含まれています。
最高気温と最高気温を別々に集計するために、日ごとの最高気温と最低気温を異なる列になるように設定したいと思います。
縦一列のデータを横一列にしたい場合、クロスタブツール使用し、以下の項目を設定します。
クロスタブツールを使用する際に、少なくとも2列(ヘッダー列と値の列)が必要となります。
- グループ化するデータ項目の指定
- 列ヘッダー項目の指定
- 値とするデータ列の指定
- 値の集計方法
グループ化するデータ項目の指定では、一列に取りまとめる際に残しておくキーとなるフィールド項目を指定します。
列ヘッダーの変更、ヘッダーとするのフィールド項目を指定します。
値とするデータ列の指定では上記にて設定したヘッダー列に表示する対象の項目を指定します。
最後に、値の集計方法を指定します。この際、“新しい列の変更”にて指定したフィールド項目のデータ型によって、指定可能な集計方法が異なります。
-
- 数値型の場合
- 合計
- 平均
- カウント(Nullを除外)
- カウント(Nullを含む)
- 行パーセント
- 列パーセント
- 数値型の場合
-
- 文字列型の場合
- 連結(区切り文字も指定します)
- 最初
- 最後
- 文字列型の場合
- 日付型の場合
- 最初
- 最後
上記設定をしたワークフローを実行した結果がこちらになります。
クロスタブツールのおさえておきたいポイント
クロスタブツールにて、選択されなかったフィールド項目は出力データから除外されます。
選択しなかったフィールド項目がその後の集計処理に必要な場合は、結合ツールなどを使用してデータ項目を改めて追加してください。
また、列ヘッダーとして指定した項目は、表示順ではなく、昇順にてデータが出力されます。
そのため、データの表示順を維持する必要がある場合には、カウントレコードツールなどを使用して表示順がコントロール可能な状態にしてクロスタブツールを設定してください
最後に
Alteryx Designerのクロスタブツールについて、まとめてみました。
異なる種類のデータが縦一列に並んでいる場合、クロスタブツールを使用することで、集計処理に役立てることができますので、集計の前処理などにをご活用ください。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。